FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7765, 450 aa 1>>>pF1KB7765 450 - 450 aa - 450 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2772+/-0.00092; mu= 5.0690+/- 0.055 mean_var=173.8064+/-36.010, 0's: 0 Z-trim(112.1): 14 B-trim: 332 in 1/52 Lambda= 0.097284 statistics sampled from 12939 (12947) to 12939 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.398), width: 16 Scan time: 3.540 The best scores are: opt bits E(32554) CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20 ( 450) 3038 438.4 7.2e-123 CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6 ( 460) 1653 244.0 2.4e-64 CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6 ( 431) 1468 218.0 1.5e-56 CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6 ( 433) 1468 218.0 1.5e-56 CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6 ( 437) 1468 218.0 1.5e-56 CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1 ( 442) 1367 203.8 2.8e-52 CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6 ( 452) 1008 153.5 4.2e-37 >>CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20 (450 aa) initn: 3038 init1: 3038 opt: 3038 Z-score: 2319.4 bits: 438.4 E(32554): 7.2e-123 Smith-Waterman score: 3038; 100.0% identity (100.0% similar) in 450 aa overlap (1-450:1-450) 10 20 30 40 50 60 pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSHHGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSHHGR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 PAGLLPHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEVQNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PAGLLPHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEVQNV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 DDQHLLLHDQTVIRKGPISMTKNPLNLPCQKELVGAVMNPTEVFCSVPGRLSLLSSTSKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DDQHLLLHDQTVIRKGPISMTKNPLNLPCQKELVGAVMNPTEVFCSVPGRLSLLSSTSKY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 KVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRKAAHVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRKAAHVT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 LLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNMLLAAQQLCK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNMLLAAQQLCK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 EFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSALQNYIKEAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSALQNYIKEAL 370 380 390 400 410 420 430 440 450 pF1KB7 IVIDKSYMNPGDQSPADSNKTLEKMEKHRK :::::::::::::::::::::::::::::: CCDS13 IVIDKSYMNPGDQSPADSNKTLEKMEKHRK 430 440 450 >>CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6 (460 aa) initn: 1468 init1: 685 opt: 1653 Z-score: 1268.7 bits: 244.0 E(32554): 2.4e-64 Smith-Waterman score: 1653; 59.6% identity (77.2% similar) in 465 aa overlap (1-450:12-460) 10 20 30 40 pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHT ::::...:::::. :::::: . . :. .:.:..: :: ::::::: CCDS49 MHSPPRDQAAIMLWKLVENVKYEDIYEDRHDGVPSHSSRLSQLGSVSQGPYSSAPPLSHT 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB7 GVAEYQPPPYFPPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQ ...::: ::::::: : : :: :::::... :. .:::::: ::. : :: : CCDS49 PSSDFQPP-YFPPPYQPLPYHQSQDPYSHVNDPYS--LNPLHQP-----QQHPWGQRQRQ 70 80 90 100 110 110 120 130 140 150 160 pF1KB7 E-GAGLPSHHGRPAGLLPHLSGLEAGAVSARRDAY--RRSDLLLPHAH-ALDAAGLAENL : :. : .: . ::.::::. ::: . :: :.:: :: .::: :....: CCDS49 EVGSEAGSLLPQPRAALPQLSGLDP-----RRDYHSVRRPDVLLHSAHHGLDA-GMGDSL 120 130 140 150 160 170 180 190 200 210 pF1KB7 GLHDMPHQ-MDEVQNVDDQH---LLLHDQTVIRKGPISMTKNPLNLPCQKE--LVGAVMN .:: . : :..::.:.: . . : ::.::.: :. :. .: .:. : : .: CCDS49 SLHGLGHPGMEDVQSVEDANNSGMNLLDQSVIKKVPVP-PKSVTSLMMNKDGFLGGMSVN 170 180 190 200 210 220 220 230 240 250 260 270 pF1KB7 PTEVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLR :::::::::::::::::::::::.:::::::::::::::::::::::::::::::::: CCDS49 TGEVFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLR 230 240 250 260 270 280 280 290 300 310 320 330 pF1KB7 EKLDKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHL :.:.::::::::::::::.:::::::::::::::::::.:.::.:::.: :.:::.: : CCDS49 ERLEKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYICETEFPAKAVSEYLNRQHT 290 300 310 320 330 340 340 350 360 370 380 390 pF1KB7 GGRNEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHG ... .:::::::..:::::::.::.::::: :.:: .:.:: .::.::.:::::::: CCDS49 DP-SDLHSRKNMLLATKQLCKEFTDLLAQDRTPIGNSRPSPILEPGIQSCLTHFSLITHG 350 360 370 380 390 400 400 410 420 430 440 450 pF1KB7 FGSQAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADS-----NKTLEKMEKHRK ::. :::::..:::::. ::: .:: ..: . : .:: .: ::::: CCDS49 FGAPAICAALTALQNYLTEALKGMDKMFLNNTTTNRHTSGEGPGSKTGDKEEKHRK 410 420 430 440 450 460 >>CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6 (431 aa) initn: 1551 init1: 743 opt: 1468 Z-score: 1128.8 bits: 218.0 E(32554): 1.5e-56 Smith-Waterman score: 1740; 63.4% identity (82.6% similar) in 443 aa overlap (17-450:10-431) 10 20 30 40 50 60 pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF :::::.:::. :.:.:...:: :. ::::::: :..::: :: CCDS34 MLVHSFSAMDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF 10 20 30 40 50 70 80 90 100 110 pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH ::::: . : :: :::::... :. .:::: :: : :. .::: :::::.. : .:. CCDS34 PPPYQPI-YPQSQDPYSHVNDPYS--LNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV : ::: ::::. ::: ::: . :: ::: ..::.. :..:..:: ..:: CCDS34 G-----LPHQLSGLD-----PRRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV 110 120 130 140 150 180 190 200 210 220 230 pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS .:.: . . :::::.:::.:..:. : .: .:. : :.:.::.::::::::::: CCDS34 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML :::::.:::::::::::::::::::.::::.:::.: :::.:.: : . ::...::::: CCDS34 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL ::..:.:::::.::.:::.: :.:: :.:: .::.::.::.::.::::: :.::::.:: CCDS34 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL 340 350 360 370 380 390 420 430 440 450 pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK :::. ::: ..:: :.. . .: .:.: :. .: ::::: CCDS34 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK 400 410 420 430 >>CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6 (433 aa) initn: 1553 init1: 743 opt: 1468 Z-score: 1128.7 bits: 218.0 E(32554): 1.5e-56 Smith-Waterman score: 1745; 63.2% identity (82.5% similar) in 446 aa overlap (14-450:9-433) 10 20 30 40 50 60 pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF : .:::::.:::. :.:.:...:: :. ::::::: :..::: :: CCDS43 MSILAKMGDWQDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF 10 20 30 40 50 70 80 90 100 110 pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH ::::: . : :: :::::... : ..:::: :: : :. .::: :::::.. : .:. CCDS43 PPPYQPI-YPQSQDPYSHVNDPY--SLNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR 60 70 80 90 100 120 130 140 150 160 170 pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV : ::: ::::. ::: ::: . :: ::: ..::.. :..:..:: ..:: CCDS43 G-----LPHQLSGLDP-----RRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV 110 120 130 140 150 180 190 200 210 220 230 pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS .:.: . . :::::.:::.:..:. : .: .:. : :.:.::.::::::::::: CCDS43 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML :::::.:::::::::::::::::::.::::.:::.: :::.:.: : . ::...::::: CCDS43 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL ::..:.:::::.::.:::.: :.:: :.:: .::.::.::.::.::::: :.::::.:: CCDS43 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL 340 350 360 370 380 390 420 430 440 450 pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK :::. ::: ..:: :.. . .: .:.: :. .: ::::: CCDS43 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK 400 410 420 430 >>CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6 (437 aa) initn: 1552 init1: 743 opt: 1468 Z-score: 1128.7 bits: 218.0 E(32554): 1.5e-56 Smith-Waterman score: 1834; 64.1% identity (83.0% similar) in 459 aa overlap (1-450:1-437) 10 20 30 40 50 60 pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF ::::.:::.::: ::::::::.:::. :.:.:...:: :. ::::::: :..::: :: CCDS45 MLWKLTDNIKYE-DCEDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF 10 20 30 40 50 70 80 90 100 110 pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH ::::: . : :: :::::... :. .:::: :: : :. .::: :::::.. : .:. CCDS45 PPPYQPI-YPQSQDPYSHVNDPYS--LNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV : ::: ::::. ::: ::: . :: ::: ..::.. :..:..:: ..:: CCDS45 G-----LPHQLSGLDP-----RRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV 120 130 140 150 180 190 200 210 220 230 pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS .:.: . . :::::.:::.:..:. : .: .:. : :.:.::.::::::::::: CCDS45 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS 160 170 180 190 200 210 240 250 260 270 280 290 pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML :::::.:::::::::::::::::::.::::.:::.: :::.:.: : . ::...::::: CCDS45 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL ::..:.:::::.::.:::.: :.:: :.:: .::.::.::.::.::::: :.::::.:: CCDS45 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL 340 350 360 370 380 390 420 430 440 450 pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK :::. ::: ..:: :.. . .: .:.: :. .: ::::: CCDS45 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK 400 410 420 430 >>CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1 (442 aa) initn: 1238 init1: 714 opt: 1367 Z-score: 1052.0 bits: 203.8 E(32554): 2.8e-52 Smith-Waterman score: 1367; 54.6% identity (72.8% similar) in 452 aa overlap (17-450:10-442) 10 20 30 40 50 pF1KB7 MLWKITDNVKYEEDCEDRHDG--SSNGNPRVPHLSSAGQHLYSPAPPLSHT----GVAEY .: :: .. :. : ::: : :.::::: :: ..::. CCDS39 MLVHTYSAMERPDGLGAAAGGAR---LSSLPQAAYGPAPPLCHTPAATAAAEF 10 20 30 40 50 60 70 80 90 100 pF1KB7 QPPPYFPPPYQQ--LAYSQSADP---YSHL-GEAYAAAINPLHQPAPTGSQQQAWPGRQS ::: :::::: : : :.:. : . :: :. :.. . :: :: : : :: . .. CCDS39 QPP-YFPPPYPQPPLPYGQAPDAAAAFPHLAGDPYGG-LAPLAQPQPP---QAAWAAPRA 60 70 80 90 100 110 120 130 140 150 160 pF1KB7 QEGAGLPSHHGRPAGLL-PHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAEN-LG : : .: ::: : .: ... ::: :: :. : : :::. :: CCDS39 AARA-----HEEPPGLLAPPARAL---GLDPRRDYATAVPRLL-HGLADGAHGLADAPLG 110 120 130 140 150 170 180 190 200 210 220 pF1KB7 LHDMPHQ--MDEVQNVDDQHLLLHDQTVIRKGPISMTKNPLN-LPCQKE-LVGAVMNPTE : . ....: .:. . : ::.::.: :: . :. : :. :::.. :: : CCDS39 LPGLAAAPGLEDLQAMDEPGMSLLDQSVIKKVPIPSKASSLSALSLAKDSLVGGITNPGE 160 170 180 190 200 210 230 240 250 260 270 280 pF1KB7 VFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKL ::::::::::::::::::::::.::::::::::::::::::::::::::::::: :::.: CCDS39 VFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERL 220 230 240 250 260 270 290 300 310 320 330 340 pF1KB7 DKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGR .::::::::::::::.:::::::::::::::::::.::::.:::.: .:::: : : . CCDS39 EKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQH-ADP 280 290 300 310 320 330 350 360 370 380 390 400 pF1KB7 NEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGS .:. .::.:::::.:.::::..:..:::.: :.:: : .:: ..:.::.::::::::::. CCDS39 GELHSRKSMLLAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGG 340 350 360 370 380 390 410 420 430 440 450 pF1KB7 QAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK :::::..:.:::. :.: .:: ... .. ... :. :: :::: CCDS39 PAICAALTAFQNYLLESLKGLDKMFLSSVGSGHGET-KASEKDAKHRK 400 410 420 430 440 >>CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6 (452 aa) initn: 1114 init1: 708 opt: 1008 Z-score: 779.5 bits: 153.5 E(32554): 4.2e-37 Smith-Waterman score: 1082; 46.9% identity (68.5% similar) in 454 aa overlap (14-447:11-432) 10 20 30 40 50 pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGN-PRVPHLSSAGQHL--YSPAPPLSHTGVAEYQPP : : :::::.. .. : :... :: . ::... .. CCDS49 MSTTFPGLVHDAEIRHDGSNSYRLMQLGCLESVANSTVAYSSSSPLTYSTTGTEFAS 10 20 30 40 50 60 70 80 90 100 110 pF1KB7 PYFPPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSH ::: .: :. : : ... .. : :: : . . ..::. : CCDS49 PYFSTNHQ---YT----PLHH--QSFHYEFQHSH-PAVTPDAYSLNSLHHSQQYYQ-QIH 60 70 80 90 100 120 130 140 150 160 pF1KB7 HGRPAGL--LPHLSGLEAGAVSARR------DAYRRSDL-LLPHAHAL----DAAGL-AE ::.:. . : . .:... .. .: ::::: :: :. :. : : . CCDS49 HGEPTDFINLHNARALKSSCLDEQRRELGCLDAYRRHDLSLMSHGSQYGMHPDQRLLPGP 110 120 130 140 150 160 170 180 190 200 210 220 pF1KB7 NLGLHDMPHQMDEVQ-NVDDQ-HLLLHDQT-VIRKGPISMTKNPLNLPCQKELVGAVMNP .::: :..: .:. : :.:. : :::.: : :.:: CCDS49 SLGL--AAAGADDLQGSVEAQCGLVLNGQGGVIRRGGT----------C-------VVNP 170 180 190 200 230 240 250 260 270 280 pF1KB7 TEVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLRE :..::::::::::::::::::::.:::.::::::::::::::::.::::::::::: ::: CCDS49 TDLFCSVPGRLSLLSSTSKYKVTIAEVKRRLSPPECLNASLLGGILRRAKSKNGGRCLRE 210 220 230 240 250 260 290 300 310 320 330 340 pF1KB7 KLDKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLG :::..::::::::::::.::::::::::::.::::::.:.::.:::.: :.:.:.: :. CCDS49 KLDRLGLNLPAGRRKAANVTLLTSLVEGEALHLARDFGYTCETEFPAKAVGEHLARQHME 270 280 290 300 310 320 350 360 370 380 390 400 pF1KB7 GRNEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGF ..:..:::.:.::..:.:::: .::::::.: :.:: .:.:. .:: :.::::::::: CCDS49 -QKEQTARKKMILATKQICKEFQDLLSQDRSPLGSSRPTPILDLDIQRHLTHFSLITHGF 330 340 350 360 370 380 410 420 430 440 450 pF1KB7 GSQAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK :. :::::.:..:. ..: : ..: . . . . :::.. . :: CCDS49 GTPAICAALSTFQTVLSEMLNYLEK-HTTHKNGGAADSGQGHANSEKAPLRKTSEAAVKE 390 400 410 420 430 440 CCDS49 GKTEKTD 450 450 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 15:15:15 2016 done: Thu Nov 3 15:15:15 2016 Total Scan time: 3.540 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]