FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6267, 301 aa 1>>>pF1KE6267 301 - 301 aa - 301 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9752+/-0.000839; mu= 17.2285+/- 0.050 mean_var=61.9687+/-12.729, 0's: 0 Z-trim(106.7): 26 B-trim: 562 in 1/48 Lambda= 0.162925 statistics sampled from 9131 (9152) to 9131 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.647), E-opt: 0.2 (0.281), width: 16 Scan time: 1.710 The best scores are: opt bits E(32554) CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 ( 301) 1981 474.0 5.9e-134 CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 ( 295) 960 234.1 1e-61 CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 ( 292) 937 228.6 4.3e-60 CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 ( 230) 846 207.2 9.6e-54 CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 ( 342) 802 197.0 1.7e-50 CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 ( 256) 656 162.6 2.9e-40 CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 ( 257) 656 162.6 2.9e-40 CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 ( 216) 615 152.9 2e-37 >>CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 (301 aa) initn: 1981 init1: 1981 opt: 1981 Z-score: 2518.4 bits: 474.0 E(32554): 5.9e-134 Smith-Waterman score: 1981; 99.7% identity (100.0% similar) in 301 aa overlap (1-301:1-301) 10 20 30 40 50 60 pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTMFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTMFL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 AGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGATYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGATYV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 LYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAILDR ::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LYHDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAILDR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 RNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAGNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAGNG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 WWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLECK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 WWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLECK 250 260 270 280 290 300 pF1KE6 L : CCDS10 L >>CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 (295 aa) initn: 958 init1: 958 opt: 960 Z-score: 1221.6 bits: 234.1 E(32554): 1e-61 Smith-Waterman score: 960; 50.4% identity (80.1% similar) in 276 aa overlap (14-289:16-290) 10 20 30 40 50 pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTM : ..: ::.. :.::::.:.:..: : ::::. : :. .:. CCDS10 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 FLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGAT .. :.::..::::.:.:::.:.::: :::::. ::. : :::.:. .:.:.:: ..... CCDS10 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 YVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAIL . .:::.:....::.: ..: . :: :::::::::::: :.: :::..: .:.. ..::. CCDS10 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 DRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAG : :: :.: ::::...:.::.... :.: : : .::::::.::::: .:::: ::: :: CCDS10 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE6 NGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLE :..::.:::.:::::..: : :.. .:::: :. . ... : . : CCDS10 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPE-PDSVFKTEQSEDKPEKYELSVIM 250 260 270 280 290 300 pF1KE6 CKL >>CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 (292 aa) initn: 984 init1: 924 opt: 937 Z-score: 1192.4 bits: 228.6 E(32554): 4.3e-60 Smith-Waterman score: 937; 50.5% identity (78.9% similar) in 279 aa overlap (11-284:14-289) 10 20 30 40 50 pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFT : :.: : : :: ::: ::...:... :.:::.: : :.:.:.: CCDS65 MGRQKELVSRCGEMLHIRYR--LLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLT 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 MFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGA . :: ..:::..: ..:.::::::::: ..:::...: ::.::::: :.: :.:: ..: CCDS65 INLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 TYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAI .. :::::. ... ..: :.::. ::.::::::. .:.. :::.:: .::. ::: .::: CCDS65 VFGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSA .: :. :: ::: .::...:..: ::: : : .:::::.:::::: .:::: ::.. CCDS65 VDPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 GNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQD-----LVSAQHKASELETPA :. :::::.:.::.:. .:. .:::... : : : :... :. ..:: CCDS65 GQHWWWVPIVSPLLGSIAGVFVYQLMIGCHL-EQPPPSNEEENVKLAHVKHKEQI 240 250 260 270 280 290 300 pF1KE6 SAQMLECKL >>CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 (230 aa) initn: 844 init1: 844 opt: 846 Z-score: 1078.3 bits: 207.2 E(32554): 9.6e-54 Smith-Waterman score: 846; 52.2% identity (81.9% similar) in 226 aa overlap (64-289:1-225) 40 50 60 70 80 90 pF1KE6 LMLLTQGAVAQAVTSGETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVG .::..::::.:.:::.:.::: :::::. : CCDS81 MAVAMAIYVAGGVSGGHINPAVSLAMCLFG 10 20 30 100 110 120 130 140 150 pF1KE6 RLPWVKLPIYILVQLLSAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPY :. : :::.:. .:.:.:: ...... .:::.:....::.: ..: . :: ::::::::: CCDS81 RMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPY 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE6 LSLNNGFLDQVLGTGMLIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPL ::: :.: :::..: .:.. ..::.: :: :.: ::::...:.::.... :.: : : . CCDS81 LSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAM 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE6 NPARDLGPRLFTYVAGWGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPE ::::::.::::: .:::: ::: :::..::.:::.:::::..: : :.. .:::: :. CCDS81 NPARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPE-PD 160 170 180 190 200 280 290 300 pF1KE6 PAQDLVSAQHKASELETPASAQMLECKL . ... : . : CCDS81 SVFKTEQSEDKPEKYELSVIM 210 220 230 >>CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 (342 aa) initn: 805 init1: 712 opt: 802 Z-score: 1019.9 bits: 197.0 E(32554): 1.7e-50 Smith-Waterman score: 802; 43.3% identity (76.2% similar) in 261 aa overlap (20-280:33-292) 10 20 30 40 pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSG ..:. ::::....:.:.. :.::. : . CCDS65 QASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN- 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE6 ETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLL . :... . :. ...::....:.: .::::.: : ..: : .::.:: :.:.:.: :.: CCDS65 KKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 SAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGM ..: :... : :.: :. ...::.: :::: ::.::::: ...: :::... ::: CCDS65 GSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGM 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE6 LIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAG : . :.:: :..:. . : : .:.:.:.. .:.:.: : : .::.::: ::.::..:: CCDS65 LQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE6 WGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELE :: .::: :..::::::::::.:: .: : .... :. : .: :. CCDS65 WGKQVFSNGENWWWVPVVAPLLGAYLGGIIYLVFIGSTIPREPLKLEDSVAYEDHGITVL 250 260 270 280 290 300 290 300 pF1KE6 TPASAQMLECKL CCDS65 PKMGSHEPTISPLTPVSVSPANRSSVHPAPPLHESMALEHF 310 320 330 340 >>CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 (256 aa) initn: 637 init1: 583 opt: 656 Z-score: 836.3 bits: 162.6 E(32554): 2.9e-40 Smith-Waterman score: 656; 43.1% identity (77.8% similar) in 216 aa overlap (20-235:32-246) 10 20 30 40 pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSG ..:. ::::....:.:.. :.::. : . CCDS83 GSGHCLRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN- 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE6 ETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLL . :... . :. ...::....:.: .::::.: : ..: : .::.:: :.:.:.: :.: CCDS83 KKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 SAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGM ..: :... : :.: :. ...::.: :::: ::.::::: ...: :::... ::: CCDS83 GSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGM 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE6 LIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAG : . :.:: :..:. . : : .:.:.:.. .:.:.: : : .::.::: ::.::..:: CCDS83 LQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE6 WGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELE :: .:: CCDS83 WGKQVFRYCPCPGPFL 250 >>CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 (257 aa) initn: 637 init1: 583 opt: 656 Z-score: 836.3 bits: 162.6 E(32554): 2.9e-40 Smith-Waterman score: 656; 43.1% identity (77.8% similar) in 216 aa overlap (20-235:33-247) 10 20 30 40 pF1KE6 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSG ..:. ::::....:.:.. :.::. : . CCDS83 QASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN- 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE6 ETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLL . :... . :. ...::....:.: .::::.: : ..: : .::.:: :.:.:.: :.: CCDS83 KKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFL 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 SAFCASGATYVLYYDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGM ..: :... : :.: :. ...::.: :::: ::.::::: ...: :::... ::: CCDS83 GSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGM 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE6 LIVGLLAILDRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAG : . :.:: :..:. . : : .:.:.:.. .:.:.: : : .::.::: ::.::..:: CCDS83 LQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAG 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE6 WGPEVFSAGNGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELE :: .:: CCDS83 WGKQVFRYCPCPGPFL 250 >>CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 (216 aa) initn: 611 init1: 583 opt: 615 Z-score: 785.3 bits: 152.9 E(32554): 2e-37 Smith-Waterman score: 615; 42.8% identity (73.6% similar) in 208 aa overlap (53-256:8-215) 30 40 50 60 70 80 pF1KE6 QCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTMFLAGSLAVTIAIYVGGNVSGAHLN :... . :. ...::....:.: .::::.: CCDS83 MVLNKKYGSYLGVNLGFGFGVTMGVHVAGRISGAHMN 10 20 30 90 100 110 120 130 140 pF1KE6 PAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGATYVLYYDALQNYTGGNLTVTGPKET : ..: : .::.:: :.:.:.: :.:..: :... : :.: :. ...::.: :::: : CCDS83 AAVTFANCALGRVPWRKFPVYVLGQFLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVAT 40 50 60 70 80 90 150 160 170 180 190 200 pF1KE6 ASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAILDRRNKGVPAGLEPVVVGMLILALG :.::::: ...: :::... :::: . :.:: :..:. . : : .:.:.:.. .: CCDS83 AGIFATYLPDHMTLWRGFLNEAWLTGMLQLCLFAITDQENNPALPGTEALVIGILVVIIG 100 110 120 130 140 150 210 220 230 240 250 pF1KE6 LSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFS----AGNGWWWVPVVAPLVGATVGTA .:.: : : .::.::: ::.::..:::: .:: : : :. :: .:. : CCDS83 VSLGMNTGYAINPSRDLPPRIFTFIAGWGKQVFRWHHLPGLHWLHHPTGAPEIGGFCGV 160 170 180 190 200 210 260 270 280 290 300 pF1KE6 TYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLECKL 301 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 11:37:58 2016 done: Tue Nov 8 11:37:58 2016 Total Scan time: 1.710 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]